پیاده سازی و بهبود عملکرد کد کننده های با نرخ بیت پایین و بسیار پایین

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر
  • نویسنده ایمان رضاییان
  • استاد راهنما محمدمهدی همایونپور
  • تعداد صفحات: ۱۵ صفحه ی اول
  • سال انتشار 1387
چکیده

در این پروژه طراحی و پیاده سازی سیستم کد کننده گفتار با نرخ بیت بسیار پایین انجام گرفته است. دو رویکرد متفاوت در طراحی و پیاده سازی سیستم کد کننده گفتار بکار گرفته شده است. اولین رویکرد استفاده از سیستم کد کننده melp استاندارد با نرخ بیت 200 بیت بر ثانیه به عنوان سیستم کد کننده پایه و سپس از راهکارهایی برای کاهش نرخ بیت ارسالی به میزان نزدیک به یک چهارم میزان استاندارد آن می باشد. از جمله این راهکارها استفاده از مفهوم ابرفریم برای انجام چندسازی ماتریسی چند مرحله ای و نیز استفاده از ضرایب باقیمانده بجای ضرایب اصلی مورد استفاده و نیز استفاده از تخمین آماری برای کاهش برخی بیتهای کم استفاده می باشد. با استفاده از این اصلاحات نرخ بیت ارسالی از 2400 بیت بر ثانیه در حالت استاندارد به حدود 620 بیت بر ثانیه کاهش یافت. همچنین در تست mos انجام شده بر روی برخی جملات سنتز شده از دادگان گفتاری فارس دات مقدار 2/3 و برای melp استاندارد مقدار ¾ حاصل گردید. همچنین نتایج تست drt برای قابل فهم بودن همخوانها میزان 2/83% برای سیستم melp کاهش نرخ داده شده و برای melp استاندارد میزان 7/95% بدست آمد. وجود کیفیت بهتر در melpاستاندارد به علت 4 برابر بودن نرخ بیت ارسالی امری طبیعی می باشد. از سوی دیگر کیفیت صدای تولیدی در melp با نرخ بیت 620 بیت بر ثانیه با توجه به کاهش 400% نرخ بیت ارسالی مناسب و قابل قبول می باشد. رویکرد دوم استفاده از سیستم کد کننده آرایی بر مبنای شناسایی و سنتز رایج و تلفیق برخی از ایده های موجوداستفاده شد. در سیستم کد کنندهmelp برای بالا بردن کیفیت سیگنال گفتار تولیدی می باشد. از جمله این راهکارها استفاده از سیگنال تحریک ترکیبی بجای سیگنال ساده مورد استفاده و همچنین استفاده از یک فیلتر ثانویه برای بهبود کیفیت گفتار تولیدی می باشد. در سیستم کد کننده آوای موجود به جای استفاده از سیگنال تحریک پالس یا نویز برای حالتهای واکدار و بیواک از یک سیگنال تحریک ترکیبی مشابه آنجه در سیستم ..مورد استفاده قرار گرفته است. بهره گرفته شده است این عمل باعث می شود که سیگنال تحریک هر فریم تا حد زیادی به سیگنال تحریک اصلی نزدیک شده و کیفیت مطلوبتری را بدست دهد. همچنین استفاده از فیلتر ثانویه برای تقویت فرمتهای گفتار و نیز استفاده از اطلاعات گوینده برای ایجاد تطبیق گفتار تولیدی یا گتفار اصلی گوینده باعث بهبود کیفت گفتار تولیدی می گردد. سیستم کد کننده آرایی حاصل نرخ بیت ارسال در حدود 400 بیت بر ثانیه خواهد داشت که در صورتی که از تطبیق گوینده نیز استفاده شود. میزان نرخ بیت به 50 بیت بر ثانیه افزایش می یابد. در تست انجام شده بر روی سیستم کد کننده آرایی در تست mos مقدار 1/3 حاصل گردید. همچنین در تستdrt نیز با توجه به اصلاحات اعمال شده مقدار در صد شناسایی همخوانها برابر 6/81% حاصل گردید.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

فشرده سازی تصاویر اثر انگشت در نرخ بیت های پایین با رویکرد حفظ یا بهبود کارایی بازشناسی

در روش فشرده سازی پیشنهادی در این مقاله، با بهره گیری از ویژگی دوحالته بودن تصاویر اثرانگشت، از تکنیک پیشنهادیِ تغییر مقیاس جهت افزایش کارایی فشرده سازی کدگذار spiht و از برخی تکنیک های پیشنهادی جهت حذف اثرنشتی حاصل از فشرده سازی در نرخ بیتهای پایین و افزایش کارایی بازشناسیِ روش فشرده سازی پیشنهادی استفاده شده است. همچنین، اثرات فشرده سازی روی بازشناسی بررسی شده و در این بررسی، یک معیار برحسب نقط...

متن کامل

شاخص‌های تکاملی در کودکان با وزن تولد طبیعی، پایین و بسیار پایین

  شاخص‌های تکاملی در کودکان با وزن تولد طبیعی، پایین و بسیار پایین     زهرا عبدیزدان [1] ، سهیلا احسان پور [2] *، الهه همتی [3]     تاریخ دریافت 01/03/1392 تاریخ پذیرش 20/06/1392   چکیده   پیش زمینه و هدف: در سال‌های اخیر به دلیل راه‌اندازی بخش‌های متعدد مراقبت ویژه نوزادان ( NICU ) شانس بقاء نوزادان V L B W و L B W در کشورهای مختلف جهان و از جمله ایران افزایش یافته است. ولی این نگرانی وجود دار...

متن کامل

فشرده سازی تصاویر پرسنلی با نرخ بیت پایین

یک تصویر به صورت معمولی و در حالتی که 3 بایت برای هر پیکسل (یک بایت برای هر کدام از عناصر رنگ r و g و b) آن استفاده می شود حجم قابل ملاحظه ای را اشغال می کند لذا برای کاهش این حجم از روشهای مختلف استفاده می شود. بهترین روشی که مورد استفاده قرار می گیرد روش jpeg است که دارای نسبت فشردگی خوبی است . در این پروژه سه روش فشرده سازی را اجرا کرده و آنها را نسبت به روش jpeg مقایسه کرده ایم. سه روش iir-...

15 صفحه اول

مقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure

کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...

متن کامل

ملاحظات طراحی و پیاده¬سازی اثربخش نظام جانشین¬پروری در یک شرکت با رسمیت پایین و کارکنان دانش¬محور

هدف این مطالعه موردی، شناسایی تأثیر ویژگی¬های درونی یک سازمان بر طراحی و پیاده¬سازی اثربخش نظام جانشین¬پروری می¬باشد. ویژگی¬های سازمان مورد مطالعه عبارتند از: رسمیت پایین، برخورداری از رشد سریع، وجود کارکنان دانش¬محور، و برخورداری از مالکان و مدیران مشترک. در این تحقیق با استفاده از روش تجزیه و تحلیل تم بر روی داده¬های حاصل از مصاحبه¬های نیمه-ساختاریافته، روش¬های مناسب اجرای هر گام از برنامه ...

متن کامل

یک سلول XOR جدید دو ورودی مبتنی بر CNTFET با توان نشتی فوق العاده پایین برای تمام جمع کننده های ولتاژ پایین و توان پایین

گیت XOR یکی از بلوک های سازنده پایه در یک مدار تمام جمع کننده می باشد که بهبود عملکرد آن می تواند به یک تمام جمع کننده بهبود یافته منجر شود. بدین منظور، در این مقاله، یک سلول XOR جدید ولتاژ پایین مبتنی بر ترانزیستور های اثر میدان نانو لوله کربنی (CNTFET) پیشنهاد شده است. اهداف طراحی اصلی برای این مدار جدید، اتلاف توان کم، جریان نشتی پایین و سوئینگ ولتاژ کامل در یک ولتاژ تغذیه کم (Vdd = 0.5 V) م...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023